알라딘
데이터 분석을 떠받치는 수학 - 엑셀과 수학, 통계로 배우는 데이터 과학의 기술, 개정판
위키북스
손민규 (지은이)
2020-01-03
대출가능 (보유:1, 대출:0)
데이터 분석을 위한 첫 걸음을 도와드립니다!
이 책은 데이터 분석을 하고 싶지만 어디서 어떻게 시작할지를 모르는 사람과 관련 수학 지식이 부족해 어려워하는 사람을 위해 압축, 분류, 예측 알고리즘 중에 가장 많이 사용되는 알고리즘을 골라 엑셀만으로 충분히 이해할 수 있도록 구성했다. 엑셀은 데이터 관리 및 분석에 특화된 최고의 도구로 R이나 파이썬 같이 설치가 필요한 데이터 분석 프로그램과 달리 대부분의 컴퓨터에 기본으로 설치돼 있어 간편하게 사용할 수 있다.
실습 예제로는 데이터 분석 입문할 때 가장 많이 사용되는 보스턴 주택 가격 데이터를 이용한 다중 선형 회귀 분석과 주성분 분석을 통해 주택 가격을 예측해 보면서 실제 데이터 분석이 어떻게 진행되는지 체험할 수 있다.
이 책으로 차근차근 실습을 진행한다면 압축, 분류, 예측 알고리즘에 대해 충분히 이해할 수 있을 것이다. 학습한 내용을 바탕으로 경험을 쌓는다면 멋진 데이터 과학자가 될 수 있을 것이다.
소니 반도체에서 데이터 분석업무와 알고리즘 및 시스템 개발 업무와 사원 대상 통계 알고리즘 강의를 진행했으며, 현재 삼성전자에서 데이터 분석 업무를 하고 있다. 일본 큐슈대학교에서 인공지능의 한 분야인 강화학습(Reinforcement Learning) 알고리즘 개발로 박사학위를 받았으며, 관심분야는 강화학습, 인공신경망(Neural Network), 유전 알고리즘(Genetic Algorithm) 등 머신러닝(Machine Learning) 알고리즘을 활용한 시스템 개발이다.
- 저서: 《데이터 분석을 떠받치는 수학(2018)》 《기초부터 시작하는 강화학습/신경망 알고리즘(2019)》
- 번역: 《가장 쉬운 딥러닝 입문 교실(2018)》 《실전! 딥러닝(2019)》 《파이썬 데이터 분석 실무 테크닉 100(2010)》
- 감수: 《정석으로 배우는 딥러닝(2017)》
▣ 01장: 데이터 분석이란?
1.1 데이터 분석 프로세스
___1.1.1 문제 정의
___1.1.2 데이터 수집
___1.1.3 데이터 분석
___1.1.4 검증 및 고찰
1.2 데이터 분석 알고리즘의 특징과 종류
▣ 02장: 데이터 분석을 위한 기초
2.1 기초 통계량
___2.1.1 평균
___2.1.2 중앙값
___2.1.3 최빈값
___2.1.4 최댓값, 최솟값, 범위
2.2 분산과 표준편차
___2.2.1 표준오차
___2.2.2 분산
___2.2.3 표준편차
___2.2.4 모집단의 개수와 표본집단의 개수
___2.2.5 엑셀로 분산과 표준편차를 계산하는 방법
___2.2.6 정규분포
___2.2.7 정규분포를 이용한 이상점 검출
2.3 데이터 표준화
2.4 공분산과 상관계수
___2.4.1 공분산
___2.4.2 상관계수
2.5 행렬
___2.5.1 정방행렬
___2.5.2 영행렬
___2.5.3 대각행렬과 단위행렬
___2.5.4 삼각행렬
___2.5.5 전치행렬
2.6 행렬 연산
___2.6.1 행렬의 덧셈과 뺄셈
___2.6.2 행렬의 곱셈
___2.6.3 공분산 행렬과 상관행렬
___2.6.3 역행렬
2.7 데이터 분석과 행렬
___2.7.1 연립 방정식과 행렬
___2.7.2 좌표변환과 행렬
2.8 미분과 편미분
___2.8.1 미분
___2.8.2 편미분
▣ 03장: 압축 기법: 주성분분석
3.1 주성분분석 개요
3.2 주성분분석 실습
___Step 0 데이터 표준화
___Step 1 상관행렬을 구한다
___Step 2 상관행렬의 고윳값, 고유벡터를 구한다
___Step 3 고유벡터를 이용해 표준화된 데이터를 주성분 공간으로 이동시킨다
3.3 주성분분석 활용
___3.3.1 차원축소
___3.3.2 데이터 분석
▣ 04장: 분류 기법: 마할라노비스 -다구찌 시스템
4.1 개요
4.2 MTS 분석 실습
___4.2.1 모델 구축
___4.2.2 모델 활용(이상 감지)
4.3 역행렬을 이용한 MTS 구축
___4.3.1 모델 구축
___4.3.2 모델 활용(이상 감지)
▣ 05장: 예측기법: 회귀 분석
5.1 선형회귀분석
___5.1.1 단순 선형 회귀
___5.1.2 다중회귀
5.2 주성분회귀분석
___5.2.1 데이터 표준화
___5.2.2 상관행렬 계산
___5.2.3 고윳값, 고유벡터 계산
___5.2.4 좌표변환
___5.2.5 다중회귀 계산
___5.2.6 변환행렬 A 계산
5.3 부분최소제곱법 분석
___5.3.1 데이터 표준화
___5.3.2 가중치 행렬 W 계산
___5.3.3 잠재변수 T 계산
___5.3.4 다중회귀 계산
___5.3.5. 표준화 회귀계수 계산
___5.3.6 회귀계수 계산
▣ 06장: 데이터 분석 실습
6.1 보스턴 주택 가격 데이터
6.2 다중 선형 회귀 분석
6.3 주성분 분석을 이용한 특징 선택